import re
#正则表达式分组
website="编程帮 www.biancheng.net"

#匹配所有，不分组
pattern_1 = re.compile(r'\w+\s+\w+\.\w+\.\w+')
print(pattern_1.findall(website))


#分组() ,只返回分组匹配到的内容
pattern_2 = re.compile(r'(\w+)\s+\w+\.\w+\.\w+')
print(pattern_2.findall(website))

#多个()
pattern_3 = re.compile(r'(\w+)\s+(\w+\.\w+\.\w+)')
print(pattern_3.findall(website))


html="""
<div class="movie-item-info">
<p class="name">
<a title="你好，李焕英">你好，李焕英</a>
</p>
<p class="star">
主演：贾玲,张小斐,沈腾
</p>    
</div>
<div class="movie-item-info">
<p class="name">
<a title="刺杀，小说家">刺杀，小说家</a>
</p>
<p class="star">
主演：雷佳音,杨幂,董子健,于和伟
</p>    
</div> 
"""

pattern_4 = re.compile(r'<div.*?<a title="(.*?)">.*?"star">(.*?)</p>.*?/div?',re.S)
print(pattern_4.findall(html))
list = pattern_4.findall(html)
if list:
    for item in list:
        print("名称：",item[0])
        print("主演: ",item[1].strip())
        print("电影：{}".format(item[0]))
        print("主演：{}".format(item[1].strip()))
        print(20*"*")